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Abstract 



Recorded speech elements (Si) are compared with preselected partial word segments (TWi) of the speech 
elements which are assigned to these specific mechanical data elements. Before the comparison, the key 
speech elements (SEi) relevant to the technical plant are selected. The selection of a partial word segment 
is made based on a previous full word segment(W) according to the spatial position of the user (B) and/or 
the gesture of the user and/or the viewing direction (BR) of the user and/or the speech direction of the user. 
Selection of a partial word segment reduces the complexity of the word segment during speech input. The 
speech recognition module (6) includes a filter (8) for selection of key speech elements. 
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(54) Verfahren zur Umwandlung von sprachllch eingegebenen Informationen in 
maschinenlesbare Daten 

(57) Um bei einer Umwandlung von sprachlich ein- 
gegebenen Informationen eines Benutzers (B) in ein 
Steuer- und Informationssystem (2) einer technischen 
Aniage in maschinenlesbare Daten bei hoher, ergono- 
mischer Eingabegeschwindigkeit eine hohe Zuverlas- 
sigkeit auch bei einem komplexen zugrundeltegenden 
Wortschatz (W) zu gewahrteisten, werden erf indungsge- 
ma(3 durch einen Vergleich von aufgenommenen 
Sprachelementen (Sj) mil einem anhand von Daten uber 
den Benutzer (B) vorausgewahlten Teilwortschatz (TWj) 
den Spracfielementen (Sj) durcfi diese bestimmte 
maschinelle Datenelemente (DEJzugeordnet. Durch die 
Auswahl eines Teilwortschatzes (TWj) aus einem 
Gesamtwortschatz (W) wird die Komplexitat des zugrun- 
deliegenden Wortschatzes (W) erst wShrend der 
Spracheingabe reduziert. so daB eine hohe Erken- 
nungsrate gewShrleistet ist. 
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Beschreibung 

Die Erf indung betrifft ein Verfehren zur Umwandlung 
von in ein Steuer- und Informationssystem einer techni- 
schen Aniage sprachlich eingegebenen Informationen 
eines Benutzers in maschinenlesbare Daten, bei dem 
durch einen Vergleich von aufgenommenen Sprachele- 
menten mit einem vorausgewShlten Teilwortschatz den 
Sprachelementen durch diese bestimmte maschinelle 
Datenelemente zugeordnet werden. Sie betrifft weiter 
ein System zur Sprachetngabe von Informationen fur 
eine technische Anlage. 

Fur den Betrieb einer technischen Aniage, insbe- 
sondere einer Kraftwerksanlage, ist eine schnelle und 
zuverlassige Eingabe von Informationen eines Benut- 
zers in ein Steuer- und Informationssystem der techni- 
schen Aniage erforderlich. Fur die Weiterverarbeitung in 
Steuer- oder Regelprozessen mussen die eingegebe- 
nen Informationen in maschinenverarbeitbare Daten, 
beispielsweise Codes oder Rechnerbefehle, umgewan- 
delt werden. Insbesondere in der Leittechnik einer Kraft- 
werksanlage erfolgt eine derartige Informationseingabe 
uWicherweise uber eine Tastatur oder mausunterstutzt 
uber einen Bildschirm eines Computers. Eine derartige 
Informationseingabe ist jedoch zeitaufwendig. insbeson- 
dere im Vergleich mif gesprochenen Informationen. 

Eine schnellere Eingabe von Informationen kann 
mittels Spracherkennersystemen erfolgen. Dabei wer- 
den sprachlich eingegebene Informationen eines Benut- 
zers in maschinenlesbare Daten umgeselzt. indem 
aufgenommene Sprachelemente mil einem Wortschatz 
verglichen und anhand dieses Vergleichs maschinell 
identff izlert werden, wobei den identifizierten Sprachele- 
menten maschinelle Datenelemente zugeordnet wer- 
den. UWiche Spracherkenner ordnen eine erkannte 
Lautfolge einer Uste von Namen von Bedienelementen 
2u und wahlen das wahrscheinlichste Ustendokument 
aus. Bei herkommlichen Spracherkennersystemen 
nimmt jedoch die Erkennungsrate der Sprachelemente 
und somit die Zuverlassigkeit der Spracherkennung mit 
zunehmender GrOBe des Wortschatzes stark ab. Bei 
komplexen Wortschatzen, wie sie insbesondere beim 
Betrieb einer technischen Aniage oder einer Kraftwerks- 
anlage anfallen, sind herkommiiche Spracherkenner 
daher unzuverlassig und somit nicht einsetzbar. Um die 
Erkennungsrate eines Spracherkenners zu erhohen, 
muB der zugrundeliegende Wortschatz, zum Beispiel im 
Hinblick auf die Anzahl der enthattenen Worter, einge- 
schrankt werden. Dies schrankt jedoch die Flexibilitat 
eines derartigen Spracheingabesystems ein. 

Ein System und ein Verfahren zur Spracheingabe 
von Informationen. bei dem der zugrundeliegende Wort- 
schatz in eine Anzahl von Teilwortschiatzen gegliedert 
ist. Ist aus der DE-A-42 16 455 bekannt. Die Auswahl 
des Teilwortschatzes erfolgt dabei mittels eines sprach- 
lich eingegebenen Identif izlerungscodes. Eine derartige 
Vorauswahl Ist jedoch zeitaufwendig und, insbesondere 
in Notfallsituationen. nur eingeschrankt zuvertSssig, da 



der Identifizierungscode mit hoher sprachlicher Genau- 
igkert einzugeben ist. 

Der Erf indung llegt daher die Aufgabe zugrunde, ein 
Verfahren der obengenannten Art zur Umwandlung von 
5 sprachlich eingegebenen Informationen eines Benut- 
zers in ein Steuer- und Informationssystem aner techni- 
schen Aniage In maschinenlesbare Daten anzugeben, 
das bei einem komplexen zugrundeliegenden Wort- 
schatz bei hoher Eingabegeschwindigkelt eine hohe 
10 Zuverlassigkeit gewahrleistet. Dies soil mit einem beson- 
ders geeigneten System zur Spracheingabe von Infor- 
mationen fur eine technische Aniage erreicht werden. 

Bezuglich des Verfahrens wird diese Aufgabe erf in- 
dungsgemafJ gelGst, indem die Vorauswahl des Teilwort- 
15 schatzes anhand der rSumlichen Position des Benutzers 
und/oder anhand der Gestik des Benutzers und/oder 
anhand der Blickrichtung des Benutzers und/oder 
anhand der Sprechrichtung des Benutzers erfolgt. 
Die Erf indung geht dabei von der Uberlegung aus, 
20 daB bei einer Aufteilung eines fur eine technische Aniage 
relevanten Wortschatzes in Teilwortschatze einer der 
Teilwortschatze vorausgewahit werden kann. Auf der 
Grundlage des ausgewShlten Teilwortschatzes konnen 
dann aufgenommene Sprachelemente mit Elementen 
25 des Teilwortschatzes, insbesor»dere mit WOrtern oder 
Wortbestandteileh. verglichen und somit identifiziert 
werden. Durch die Auswahl eines Teilwortschatzes wird 
die Komplexitat des zugrundeliegenden Wortschatzes 
erst wahrend der Spracheingabe reduziert. so daB auch 
30 bei einem koirplexen zugrundeliegenden Wortschatz 
eine hohe Erkennungsrate gewahrleistet ist Welterhin 
ausgehend von der Uberlegung, daB bei einer raumlich 
ausgedehnten Leitwarte einer Kraftwerksanlage kon- 
zeptionell zusammenhangende Anzeigeinstrumente 
35 und Bedienelemente eines Teilsystems der technischen 
Aniage ortlich zusammengruppiert angeordnet sind, 
kann bereits durch die raumltche Position des Benutzers 
das zu bedienende Teilsystem identifiziert und somit der 
diesem Teilsystem zugeordnete Teilwortschatz ausge- 
40 w^hlt werden, wobei sich der Benutzer zur Bedienung 
dieses Teilsystems in dessen Nahe aufhait. 

Durch die Vorauswahl des Teilwortschatzes anhand 
der Gestik wird dem Benutzer beispielsweise ermOglicht. 
durch Deuten auf ein Teilsystem der technischen 
45 Aniage, beispielsweise durch eine Armbewegung, das 
zu bedienende Teilsystem zu identrfizieren. 

Ausgehend von der Beobachftung, daB konzeptio- 
nell zusammenhangende Anzeigeinstrumente und 
Bedienelemente eines zu bedienenden Teilsystems der 
50 technischen Aniage uUichenveise in einem gemeinsa- 
men Blickbereich des Benutzers angeordnet sind. kann 
zudem durch die Ermittlung der Blickrichtung des Benut- 
zers das zu bedienende Teilsystem fruhzeitig erkannt 
und auf dieser Grundlage eine zutreffende Auswahl des 
55 Teilwortschatzes erreicht werden, 

Bezuglich des Systems zur Spracheingabe von 
Informationen fur eine technische Aniage. bei dem ein 
Sprachdetektor zur Aufnahme von Sprachelementen 
eines Benutzers und ein Spracherkennermodul zur 
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Zuordnung von maschinenlesbaren Datenelementen zu 
Sprachelementen vorgesehen sind, wobei das Sprach- 
erkennermodul einen Analysebaustein zur Vorauswah! 
eines Teilwortschatzes aus einem im Spracherkenner- 
modul hinterlegten Wortschatz aufweist. wird die Auf- 5 
gabe erfindungsgem^B gelGst durch ein 
Beobachtungsinstrument zur Beobachtung des Benut- 
zers. 

Von dem Sprachdeteklor aufgenommene Sprach- 
elemente eines Benutzers warden an das Spracherken- 10 
nermodul weitergeleitet. Durch den Analysebaustein 
des Spracherkennermoduls erfolgt eine Vorauswahl 
eines Teilwortschatzes aus einem im Spracherkenner- 
modul hinterlegten Wortschatz anhand von von dem 
Beobachtungsinstrument ermittelten Daten uber dem .is 
Benutzers- Durch Vergleich der aufgenommenen 
Sprachelemente mit dem somit ausgewShlten Teilwort- 
schatz werden den Sprachelementen maschinelle 
Datenelemente zugeordnet, wobei eine hohe Zuverlas- 
sigkeit der Spracherkennung durch Reduktion des 20 
Gesamtwortschatzes auf den Teilwortschatz gewShrlei- 
stet ist- 

Zur Auswahl von fur die technische Aniage relevan- 
ten Schlusselsprachelementen aus alien aufgenomme- 
nen Sprachelementen weist das Spracherkennermodul 25 
zweckmaBigerweise einen Filterbaustein auf; < 

In vorteilhafter Ausgestaltung ist das Beobach- 
tungsinstrument ein Positionsmelder zur Ermittlung der 
raumlichen Position des Benutzers. Anhand .der mittels 
des Positionsmelders ermittelten Position des Benutzers 30 
kann ein zu bedienendes Teilsystem der technischen 
Aniage identifiziert und ein diesem Teilsystem zugeord- 
neter Teilwortschatz ausgewahit werden. 

GemSB einer zweckmSBigen Weiterbiidung ist das 
Beobachtungsinstrument zur Ermittlung der Blickrich- 35 
tung Oder der Gestik des Benutzers vorgesehen. Anhand 
derdadurch ermittelbaren Blickrichtung oder Gestikdes 
Benutzers kann ebenfalls die Identifikation eines zu 
bedienenden Teilsystems der technischen Aniage und 
somit die Auswahl des diesem zugrundeliegenden Teil- 40 
wortschatzes erfolgen. 

Zur Ermittlung der Sprechrichtung des Benutzers 
weist das Spracheingabesystem einen Detektor auf. 

Die mit der Erfindung erzielten Vorteile bestehen 
insbesondere darin, daR durch die Auswahl eines Teil- 45 
wortschatzes aus einem Gesamtwortschatz bei einem 
Spracheingabesystem die Zuverlassigkeit der Zuord- 
nung von maschineilen Datenelementen zu aufgenom- 
menen Sprachelementen auch bei einem 
zugrundeliegenden komplexen Gesamtwortschatz , so 
gewahrleistet ist. Durch die AuswaN des Teilwortschat- 
zes anhand von von der Spracheingabe unabhangigen 
Daten uber den Benutzer sind ein derartiges Verfahren 
und ein derartiges System besonders effektiv und 
besonders zuveriassig. 55 

Ein Ausfuhrungsbeispiel der Erfindung wird anhand 
einer Zeichnung naher erjautert. Diese zeigt ein System 

1 zur Spracheingabe von irtformationen in eine Leitwarte 

2 einer nicht naher dargestellten Kraftwerksanlage. An 



der Leitwarte 2 sind Monitore 3 zur Darstellung von Infor- 
mationen und prozeBrelevartten Daten der Kraftwerks- 
anlage angeordnet. Die Kraftwerksanlage ist 
organisatorisch in Teilsysteme gegliedert, denen jeweils 
einer der Monitore 3 zur Darstellung der sie betreff enden 
Informationen zugeordnet ist. 

Das Spracheingabesystem 1 umfaBt einen Sprach- 
deteklor 4 - beispielsweise ein Mikrophon - und ein 
Spracherkennermodul 6. Das Spracherkennermodul 6 
umfaBt einen Filterbaustein 8. eine uber eine Datenlei- 
tung 9 mit der Leitwarte 2 verbundene Zuordnungsein- 
heit 10, einen Analysebaustein 12 und eine Datenbank 
14. In der Datenbank 14 ist ein in mehrere Teilwort- 
schatze TWj, mit i = 1, .... n, gegliederter Gesamtwort- 
schatz W hinterlegt. 

Ein Beobachtungsinstrument 16 ist Ciber eine Lei- 
tung 18 mit dem Analysebaustein 12 verbunden. Das 
Beobachtungsinstrument 16 umfaBt einen Detektor 20 
und eine Kontrolleinheit 22. Der Detektor 20 ist zweck- 
nr^Bigenweise eine Kamera. Er kann alternativ aber 
auch ein Mikrophonarray, ein Headtracker oder ein Eye- 
tracker sein. Anstelle der Leitungen 9. 18 konnen auch 
Funkverbindungen oder andere Datenubertragungsmit- 
tel vorgesehen seia 

Mittels der Kamera 20 wird die durch den Pfeil BR 
angedeutete Blickrichtung eines Benutzers B des 
Spracheihgabesystems.1 durch das Kontrollsystem 22 
des Beobachtungsinstmments 16 erfaBt und in einen die 
Blickrichtung beschreibenden Datensatz D umgewan- 
delt. Der Datensatz D wird uber die„Leitung 18 an den 
Analysebaustein 12 ubergeben. Anhand des Datensat- 
zes D wird im Analysebaustein 12 der vom Benutzer B 
angeblickte Monitor 3* ermittelt und somit das zu bedie- 
nende und diesem Monitor 3* zugeordnete Teilsystem 
der Kraftwerksanlage identifiziert. Ein diesem Teilsy- 
stem zugrundeliegender Teilwortschatz TWj wird vom 
Analysemodul 12 aus den Teilwortschatzen TWi des in 
der Datenbank 14 hinterlegten Gesamtwortschatzes W 
ausgewahtt- Der ausgewahlte Teilwortschatz TWj wird 
vom Analysemodul 1 2 der Vergleichseinheit 10 bereitge- 
stellt- Mittels des Sprachdetektors 4 aufgenommene 
Sprachelemente Sj des Benutzers B werden dem Filter- 
baustein 8 zugefuhrt Im Filterbaustein 8 werden aus den 
aufgenommenen Sprachelementen Sj alle relevanten 
Schlusselsprachelemente ausgewahlt. Die Schlussel- 
sprachelemente SEj werden der Vergleichseinheit 10 
zugefuhrt. Anhand des ausgewahtten Teilwortschatzes 
TWt werden den ausgewahlten Schlusselsprachele- 
menten SEj maschinell verarbeitbare Datenelemente 
DEj zugeordnet. Die Datenelemente DEj. insbesondere 
Befehlscodes, werden uber die Datenleitung 9 der Leit- 
warte 2 zugefuhrt und dort zur Steuerung oder Informa- 
tionsverarbeitung der Kraftwerksanlage herangezogen. 

Patentanspruche 

1. Verfahren zur Umwandlung von in ein Steuer- und 
Informationssystem (2) einer technischen Aniage 
sprachlich eingegebenen Informationen eines 
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Benutzers (B) in maschineniesbare Daten, wobei 
durch einen Vergleich von aufgenommenen Sprach- 
elementen (SJ mit einem vorausgewahlten Teilwort- 
schatz (TWj) den Sprachelementen (Sj) durch diese 
bestimmte maschinelle Datenelemente (DEJ zuge- 5 
ordnet werden, 

dadurch gekennzeichnet, daB eine Vorauswahl 
des Teilwortschatzes (TWj) aus einem hinterlegten 
Gesanntwortschatz (W) anhand der raumlichen 
Position des Benutzers (B) und/oder anhand der 
Gestik des Benutzers (B) und/oder anhand der 
Blickrichtung (BR) des Benutzers (B) und/oder 
anhand der Sprechrichtung des Benutzers (B) 
erfolgt. 

15 

2. System (1) zur Spracheingabe von Informationen 
fur eine technische Aniage. insbesondere zur 
Durchf Lihrung des Verfahrens nach Anspojch 1 , mrt 
einem Sprachdetektor (4) zur /Kufnahme von 
Sprachelementen (Sj) eines Benutzers (B) und mrt 20 
einem Spracherkennermodul (6) zur Zuordnung von 
maschinenlesbaren Datenelementen (DEj) zu 
Sprachelementen (Sj), wobei das Spracherkenner- 
modu! (6) einen Analysebaustein (12) zur Voraus- 
wahl eines Teilwortschatzes (TWJ aus einem im '25 
Spracherkennermodul (6) hinterlegten Gesamt- 
wortschatz (W) aufweist. 

gekennzeichnet durch ein Beobachtungsinstru- 
ment (16) zur Beobachtung des Benutzers. 

30 

3. Spracheingabesystem nach /Vnspruch 2, 
dadurch gekennzeichnet, daB das Beobachlungs- 
instrument ein Positionsmelder zur Ermittlung der 
raumlichen Position des Benutzers (B) ist. 

35 

4. Spracheingabesystem nach einem der Anspnjche 
2 Oder 3, 

dadurch gekennzeichnet, daB das Beobachtungs- 
instrument (16) zur Ermittlung der Blickrichtung 
(BR) Oder der Gestik des Benutzers (B) vorgesehen 40 
ist. 

5. Spracheingabesystem nach einem der Anspruche 
2 bis 4, 

gekennzeichnet durch einen Detektor zur Ermitt- 45 
lung der Sprechrichtung des Benutzers (B). 
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(57) Urn bei einer Umwandlung von sprachlich ein- 
gegebenen Informationen eines Benutzers (B) in ein 
Steuer- und Informationssystem (2) einer technischen 
Aniage in maschinenlesbare Daten bei hoher. ergono- 
mischer Eingabegeschwindigkeit eine hohe Zuverlas- 
sigkeit auch bei einem komplexen zugrundeliegenden 
Wortschatz (W) zu gewahrleisten. werden erfindungs- 
gemaB durch einen Vergleich von aufgenommenen 
Sprachelementen (Sj) mit einem anhand von Daten 
Ober den Benutzer (B) vorausgewahlten Teilwortschatz 
(TWi) den Sprachelementen (Sj) durch diese bestimmte 
maschinelle Datenelemente (DEJ zugeordnel. Durch 
die Auswahl eines Teilwortschatzes (TWj) aus einem 
Gesamtwortschatz (W) wird die Komplexitat des 
zugrundeliegenden Wortschatzes (W) erst wShrend der 
Spracheingabe reduziert. so daB eine hohe Erken- 
nungsrate gewShrleistet ist. 
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